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义 密码 使 用 频率 上 的 差异 ， 密 码 子 与 反 密码 子 相互 作用 效率 上 的 不 同 ， 以 及 密码 子 上 下 文 关系 和 mRNA 不 同 区 
域 二 级 结构 上 的 差异 ， 造 成 了 核糖 性 对 mRNA 不 同 区 城 翻 译 速度 上 的 差异 ， 加 之 共 翻 译 折 登 的 作用 ， 使 得 mR- 


NA 的 序列 和 结构 影响 着 蛋白 质 空间 结构 的 形成 。 
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遗传 信息 由 DNA 到 RNA 再 到 蛋白 质 的 传递 
过 程 ， 是 分 子 生物 学 的 研究 核心 ， 通 常 称 之 为 分 子 
生物 学 的 中 心 法 则 。 经 过 多 年 的 研究 ,由 DNA 到 
RNA 再 到 多 肽 链 的 合成 过 程 ， 包 括 怎样 由 3 个 核 
苷 酸 序列 决定 1 个 氨基 酸 的 所 谓 遗 传 密码 ， 已 经 基 
本 清楚 。 但 是 以 一 定 氨基 酸 序列 排列 形成 的 多 肽 链 
并 不 是 活性 置 白质 分 子 ， 它 必须 折 丰 成 一 定 的 空间 
结构 才能 成 为 具有 特定 生物 功能 的 蛋白 质 分 子 。70 
年 代 初 ，Anfisen 因 提 出 蛋白 质 的 氨基 酸 序列 包含 
有 足够 的 信息 去 决定 它 的 空间 结构 的 假说 而 闭 诺 由 
尔 奖 (Anfisen，1973)。 但 是 ， 一 些 研 究 者 发 现存 
在 着 氨基 本 序列 相同 但 构象 不 同 的 蛋白 质 ， 以 及 构 
象 相似 而 氨基 酸 序 列 相差 显著 的 蛋白 质 〈Telling， 
1996)。 说 明 氨 基 酸 序列 并 不 是 决定 蛋白 质 空间 结 
构 的 充分 条 件 ， 意 味 着 除 氨基 酸 序 列 以 外 的 其 他 信 
息 对 蛋白 质 空间 结构 的 形成 也 是 重要 的 。 这 种 信息 
很 有 可 能 存在 于 mRNA 的 序列 和 结构 中 。 

遗传 密码 的 简 并 性 主要 是 与 密码 子 的 第 3 位 
一 一 “无 声 ” 密 码 位 有 关 ， 这 使 得 编码 蛋白 质 的 核 
酸 序列 有 更 大 的 自由 度 ， 人 允许 mRNA 携带 除 编码 
相应 氨基 酸 以 外 的 更 大 的 信息 量 。 因 此 ， 在 探索 蛋 
白质 折 生 机理 和 预测 蛋白 质 结构 时 ， 我 们 必须 考虑 
到 mRNA 的 序列 、 结 构 及 其 对 翻译 过 程 和 翻译 速 
率 的 影响 。 相 关 的 研究 已 经 指出 ，mRNA 序列 中 
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的 稀有 密码 子 的 使 用 与 蛋白 质 结构 域 的 连接 区 和 规 
则 二 级 结构 单元 的 连接 区 有 关 ， 翻 译 速 率 在 这 些 连 
接 区 会 降低 (Thanaraj 等 ，1996a); 在 翻译 蛋白 质 
不 同 二 级 结构 (a 一 螺旋 与 B- 折合 ) 时 ，mRNA 
区 段 的 翻译 速率 有 所 不 同 (Thanaraj 等 ，1996b); 
a 一 螺旋 与 8 一 折 友 的 N 端 与 C 端的 氨基 酸 密码 子 
特殊 密码 位 的 核 苷 酸 种 类 也 会 有 某 种 偏向 性 
(Brunak 等 ，1996)， 这些 均 说 明和 蛋白 质 折 友 方式 
与 mRNA 序列 之 间 存 在 一 定 的 相关 性 。 此 外 ， 
mRNA 二 级 结构 自身 会 影响 到 肽 链 合成 时 的 延伸 
速率 〈Le 等 ，1993)， 表 明 mRNA 二 级 结构 与 蛋 
白质 空间 结构 之 间 存 在 某 种 相关 性 。 

对 mRNA 的 序列 、 结 构 和 与 其 编码 的 蛋白 质 
的 空间 结构 关系 的 研究 不 但 可 以 完善 和 补充 中 心 法 
则 ， 提 高 蛋白 质 结构 预测 的 准确 率 ， 而 且 对 蛋白 质 
工程 和 遗传 工程 都 具有 巨大 的 实用 价值 。 本 文 结合 
我 们 实验 室 的 一 些 工 作 ， 就 该 方面 的 研究 进展 作 一 
概述 。 


1 影响 翻译 速率 的 几 大 因素 


研究 表明 ，mRNA 在 核糖 体 上 翻译 时 的 速率 
是 不 均匀 的 【Varenne 等 ，1984) ， 即 对 于 不 同 的 
mRNA 分 子 以 及 同一 个 mRNA 分 子 的 不 同 区 域 ， 
核 精 体 对 它 的 阅读 速率 有 快 有 慢 ， 在 某 些 区 段 甚 至 
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会 出 现 停 顿 和 堆积 (Kim &, 1992), BRE 
链 有 时 间 进 行 折 登 和 构象 调整 。 目 前 认为 ， 翻 译 速 
率 的 快慢 主要 依赖 于 以 下 几 点 因素 : 中 对 同 义 密码 
子 的 使 用 频率 及 密码 子 与 反 密码 子 的 相互 作用 
(Grosjean 等 ，1982); 四 密码 子 的 上 下 文 关系 
(Varenne ¥, 1989); @mRNA 不 同 区 域 的 二 级 结 
构 (Guisez F, 1993), 
1.1 密码 子 的 司 用 频率 以 及 密码 子 与 反 密 码 子 的 

相互 作用 对 翻译 速率 的 影响 

各 种 实验 证 据 表 明 ,不 同 密码 子 的 使 用 频率 与 
翻译 速率 之 间 有 很 高 的 相关 性 ,进而 影响 到 翻译 效 
率 以 及 新 生 肪 链 的 折 登 。Thanaraj & Patrick 统计 
T Escherichia coli 中 60 个 蛋白 质 所 对 应 的 mRNA 
中 9512 个 密码 子 的 使 用 频率 ,同时 分 析 了 单个 氨 
基 琶 的 同 义 密码 子 所 对 应 的 同 功 TRNA 在 细 跑 中 的 
丰 度 (Thanaraj 等 ,1996b)。 结 果 表 明 , 同 义 密码 中 
高 频 使 用 的 密码 所 对 应 的 同 功 tRNA 在 细胞 中 的 丰 
度 要 高 于 低频 密码 所 对 应 的 同 功 tRNA 的 丰 度 ， 
Val.Gly, Ile, Lys, Glu. Asp. Gln. Asn. Tyr, His, Phe 
(其 他 氨基 酸 因 缺 少 tRNA 定量 浓度 而 没 被 考虑 ) 等 
氮 基 酸 的 同 义 密码 子 的 使 用 频率 与 其 对 应 的 同 功 
tRNA 在 细胞 中 的 丰 度 的 相关 系数 为 0,94, 标 准 误 
差 是 0.008。 通 过 密码 子 的 选择 来 调控 翻译 速率 的 
物理 机 制 还 没 被 阐明 ,一 个 可 能 的 原因 是 mRNA 中 
的 高 频密 码 子 可 以 与 其 对 应 的 氮 栈 -tRNA 进行 快 
速 的 识别 和 选择 ;再 者 ,由 于 丰富 tRNA 的 反 密 码 子 
与 密码 子 的 迅速 识别 和 适中 的 亲 和 作 用 ,也 加 快 了 
翻译 的 速率 (Grosjean 等 ,1982); 也 有 证 据 表 明 ,高 
表达 的 蛋白 质 对 氨基 酸 密码 子 的 选择 有 一 定 的 偏向 
性 , 即 偏向 于 选择 对 应 有 丰富 tRNA BY BF (Lo 
bry 等 ,1994)。 这 些 研究 成 果 说 明了 基因 对 密码 子 
的 选用 是 决定 翻译 速率 的 一 个 重要 因素 ,其 原因 在 
于 高 频密 码 所 对 应 的 同 功 tRNA 在 细胞 中 的 丰 度 
高 ,与 密码 子 作用 时 更 为 快速 和 有 效 。 
1.2 密码 子 的 上 下 文 序列 对 翻译 速率 的 影响 

连续 的 三 联 体 密 码 组 成 了 mRNA 中 的 翻译 区 
段 ， 单 独 研究 某 种 氨基 酸 的 某 种 同 义 密 码 对 翻译 速 
率 的 影响 时 ， 我 们 不 能 忽略 其 所 处 的 上 下 文 环境 。 
因为 翻译 速率 的 差别 体现 在 mRNA 的 不 同 区 域 这 
一 整体 水 平 上 。 散 布 于 连续 的 高 频密 码 簇 中 的 单个 
或 少量 的 低频 密码 并 不 会 引起 核糖 体 对 mRNA M 
译 速率 的 明显 降低 ; 反之 , 分 布 于 连续 低频 密码 环 
境 中 的 少数 高 频密 码 也 不 会 造成 翻译 速率 的 明显 提 


高 。Shpaer 等 人 的 研究 表明 ， 密 码 子 的 上 下 文 序列 
限制 了 对 同 义 密 码 的 选择 ， 而 这 种 选择 的 功能 在 于 
对 翻译 速率 的 调节 (Shpaer 等 ，1986 )。Yarus 也 
指出 ;特定 的 密码 子 出 现在 特殊 的 上 下 文 环 境 中 
(Yarus 等 ，1985)， 因 此 在 考虑 翻译 速率 时 ， 要 将 
特定 的 密码 子 与 其 上 下 文 环境 综合 起 来 考虑 。 
1.3 mRNA 的 二 级 结构 对 翻译 速率 的 调节 
mRNA 的 二 级 结构 是 由 茎 区 、 环 区 (包括 末 
WH. AX, BIKA, ORM) 以 及 少量 单 链 区 组 
成 的 。 茎 区 由 于 存在 碱 基 配 对 ,其 自由 能 要 比 单 链 
区 和 环 区 低 ， 即 更 加 稳定 。 核 精 体 在 翻译 mRNA 
过 程 中 要 涉及 到 mRNA 二 级 结构 的 解体 。 在 阅读 
mRNA 茎 区 前 ， 需 要 克服 较 高 的 自由 能 障碍 使 配 
对 区 接 链 ， 所 以 翻译 速率 会 比 单 链 区 与 环 区 慢 一 
ET BO So Be Ee .XX 一 
HAGA) 测定 mRNA 的 空间 结构 困难 重重 ， 
因此 有 关 mRNA 二 级 结构 对 和 蛋白质 翻 译 速 率 的 调 
节 及 其 与 蛋白 质 构象 关系 的 研究 报道 还 不 多 , 目前 
的 研究 主要 集中 在 mRNA ERRE 5' 端 或 3 端的 
二 级 结构 对 翻译 连 率 的 影响 上 。 如 Marrten 等 用 定 
位 突变 的 方法 研究 了 mRNA 翻译 起 始 区 二 级 结构 
的 稳定 性 与 翻译 效率 的 关系 ,发现 翻译 效率 与 翻译 
起 始 区 二 级 结构 的 稳定 性 密切 相关 ， 使 苍 区 稳定 性 
增加 一 5.86 kJ Amol be A EF ae AR Se He E 
降低 SOO Fi, Be RA AGE ae oe SR eA A Oe 
始 至 关 重 要 (Marten F, 1990), TUM, PË 
着 用 理论 方法 预测 mRNA 二 级 结构 准确 率 的 进 一 
步 提 高 ，mRNA 二 级 结构 对 翻译 速率 的 调节 以 及 
mRNA 结构 与 蛋白 质 结构 对 应 关系 的 研究 必 将 取 
得 有 深远 意义 的 进展 。 


2 翻译 速率 与 共 翻 译 折 一 及 其 与 看 白 质 空 
间 结 构 的 关系 


前 面 已 经 提 到 了 造成 核糖 体 对 mRNA 翻译 速 
率 差 异 的 三 点 因素 ， 正 是 因为 翻译 速率 的 不 均一 ， 
使 得 新 生 肽 链 在 被 释放 出 核 精 体 前 便 开 始 折 熏 (Fe- 
drov ¥ ,1992;Golderg, 1995) ,我 们 将 这 种 边 翻 译 边 
折 登 的 过 程 叫做 共 翻 译 折 重 〈cotranslational fold- 
ing}。 和 蛋白 质 结构 域 以 及 规则 二 级 结构 单元 的 共 翻 
译 折合 对 促进 蛋白 质 最 终 构 象 的 形成 是 极其 重要 
的 。 
2.1 肢 通 道中 的 新 生 腑 链 的 折 友 

利用 低温 电子 显微镜 观察 到 的 E.coli 核糖 体 
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图 谱 显 示 , 了 肽 通道 的 长 度 约 为 8.5x 10-8 nm, E% 
2452.0 10° 8 nm, AT o- S B- MERT 
直径 约 为 1.0xX10-73 nm, 因 此 离开 P 位 点 (核糖 体 
ERA tRNA 所 占据 的 位 点 , 转 肽 过 程 完成 后 空 载 
的 tRNA 和 新 生 肽 链 分 别 由 此 位 置 离开 核糖 体 和 进 
人 肽 通道 ) 的 新 生 肽 链 会 有 足够 的 空间 形成 一 螺 
旋 构 象 或 发 生 肽 链 间 相互 作用 以 形成 B- MER 
(Frank 等 , 1995)。 和 蛋白 酶 保护 实验 .抗体 结合 实 
验 .以 及 交 联 实验 均 显 示 新 生 肽 链 的 30 一 和 个 残 基 
被 包 埋 在 肽 通道 中 。 在 a 一 螺旋 中 ,每 个 残 基 上 升 
的 高 度 为 1.5Sx10-”nm, 肽 链 呈 充分 伸展 构象 时 ,2 
个 连续 的 C. RF HRA BA 3.3 107° nm, 4 
40 个 残 基 的 肽 链 以 充分 伸展 的 构象 形式 存在 时 ,其 
长 度 约 为 1.32x10 7 nm, 而 肽 通道 的 长 度 仅 为 8.5 
xI0-snm, 说 明 40 个 残 基 的 新 生 的 链 是 以 螺旋 tT 
琶 、. 眷 曲 、 或 部 分 伸展 的 构象 存在 于 肽 通道 中 的 。 核 
糖 体 大 亚 基 交 联 实验 证 明了 长 的 新 生 肽 链 可 以 与 邻 
近 的 核糖 体 RNA 位 点 交 联 而 成 为 较 得 的 肽 链 
(Stade 等 ,1995) ,暗示 着 肽 通道 中 的 新 生 上 肽 链 能 够 
自身 回 折 ; 对 转 肽 过 程 的 立体 化 学 分 析 表 明 ,核糖 体 
能 够 使 新 生 肽 链 的 羧基 端 形 成 规则 的 a 螺旋 构象 
(Lim 等 ,1986); 此 外 ,位 于 次 要 肽 通道 中 的 分 子 翌 
娘 可 以 促进 和 指导 肽 链 的 折 和 又 (Hunt 等 ,1996)。 这 
些 研究 说 明 核 糖 体 的 拓扑 结构 与 新 生 炭 链 的 共 翻 译 
折 秋 假说 并 不 矛盾 ,从 一 个 侧面 说 明 翻译 速率 的 差 
蜡 会 通过 共 翻 译 折 三 影响 到 和 蛋白 质 构 象 的 形成 。 
2.2 翻译 过 程 中 蛋白 质 折 和 的 动力 学 分 析 

a— 蛇 旋 构象 中 的 氢 键 仅 局 限 在 每 图 螺旋 的 
3.6 个 氨基 酸 残 基 之 中 ,而 8B- 折 生 构象 则 涉及 到 光 
肽 链 中 相 工 较 远 的 氨基 酸 间 的 相互 作用 。 当 去 折 又 
的 蛋白 质 再 折叠 时 ,a- 螺旋 可 以 在 毫秒 级 的 时 间 尺 
度 内 形成 ,通常 要 早 于 其 他 构象 的 形成 时 间 (Ptit- 
syn, 1995), Williams 等 计算 出 21 个 Ala 组 成 的 小 
BRA o- 蝶 旋 的 折 秋 速率 为 6 Xx 107 /s( Williams 等 ， 
1996), 而 B 一 折 和 又 构 蒙 增长 的 时 间 约 为 10 ?sy 残 基 
(Zana,1975)。 在 溶菌 酶 中 ,新 生 肽 链 的 折 友 可 能 是 
先 由 螺旋 迅速 形成 一 个 紧密 的 核心 ,而 肽 链 的 其 他 
部 分 则 在 相对 长 的 时 间 尺 度 内 保持 B- HERA 
则 卷曲 状态 (Doniach 等 ,1995) , 先 形 成 的 结构 会 作 
用 于 新 生 肽 链 的 折 友 ,而 后 形成 的 结构 又 会 使 先前 
已 形成 的 结构 作出 某 些 调 整 ,这 样 ,新 生 肽 链 经 过 合 
成 延伸 \ 折 又、 构 彰 调整 ,在 不 均一 翻译 速率 的 调节 
下 最 终 形成 蛋白 质 的 三 维 结构 ,这 是 一 个 同时 进行 





着 的 .协调 的 动态 过 程 。 
2.3 ”蛋白 质 的 空间 结构 被 mRNA 的 不 同 序列 区 域 
所 编码 

对 体内 核 情 体 翻译 过 程 中 新 生 肽 链 折 友 动力 学 
的 研究 表明 ， 新生 上 肽 链 与 核糖 体 的 相互 作用 对 于 上 肽 
链 的 折 有 登 是 很 重要 的 ， 核 糖 体 可 能 会 限制 和 指导 有 蛋 
白质 最 终结 构 的 形成 (Tokatlidis 等 ，1995)。 在 蛋 
白质 翻译 和 折 芭 过 程 中 ，a -~ 螺旋 的 形成 要 时 于 B 
-- 折 又 ， 因 此 人 们 推测 a 一 螺旋 要 倾向 于 由 mRNA 
快 翻译 区 编码 ; AR, p- 折 和 又 则 倾向 于 由 mRNA 
慢 翻译 区 编码 ， 该 推测 与 人 们 的 观察 结果 一 致 。 

Thanarg & Patrick Stitt T E.coli 的 54 个 蛋白 
质 的 密码 子 使 用 频率 ， 并 与 这 54 个 蛋白 质 的 二 级 
结构 区 域 进行 比较 后 得 出 结论 ， BARRA 
区 偏向 由 mRNA RHEE aE, Te MEE 
编码 BB- 折 友 以 及 无 规则 卷曲 (Thanaraj $, 
1996b)。 进 一 步 研究 后 又 发 现 ， 蛋 白质 结构 域 和 规 
则 二 级 结构 单元 之 间 的 连接 肽 大 多 由 mRNA HE 
翻译 区 编码 ， 生 组 成 连接 上 肽 的 氮 基 酸 会 在 楼 糖 体 肽 
通道 中 堆积 ,使 新 生 上 肽 链 有 机 会 进一步 折 又 (Than- 
araj 等 ，1996a)。 

Soren 等 人 在 搜索 了 PDB 数据 库 和 GeneRank 
数据 库 后 找到 了 719 个 既 有 蛋白质 晶 体 数 据 又 有 与 
其 相 匹 配 的 mRNA 序列 的 样本 ,通过 对 这 719 个 样 
本 的 神经 网 络 计算 与 分 析 ,他 们 发 现 mRNA 序列 中 
cx 一 螺旋 编码 区 附近 存在 很 强 的 “信号 ", 即 — Rie 
的 NN 端 密码 子 第 3 位 密码 位 偏向 于 使 用 U,C 端 密 
码 子 第 1 位 偏向 于 使 用 C, 同 时 观察 到 有 8- ea 
区 N 问 和 CC 端 密码 子 第 1 个 密码 位 也 很 重要 
(Soren 等 ,1996)。IMatej 等 (1998) 最 近 的 研究 指出 
E.coli PAT B-E TFH Asn 密码 子 AAC 与 
- 折 区 的 形成 密切 相关 ;在 人 类 基因 中 a 一 螺旋 NN 
末端 的 氮 基 酸 对 Asp 密码 子 GAU 有 很 高 的 偏向 
性 ,这 种 特定 位 置 的 密码 子 对 特殊 核 苷 酸 的 选择 或 
许 对 和 蛋白质 二 级 结构 的 起 始 和 形成 是 重要 的 。 


3 ”相关 数据 库 的 建立 与 研究 谋 望 


3.1 基本 研究 方法 与 ssp 数据 库 的 建立 

在 研究 mRNA 序列 与 看 白质 结构 的 相关 性 时 ， 
研究 者 使 用 的 数据 一 般 来 自 于 NCBI 的 GeneBank 
数据 库 和 Brookhaven 的 PDB(Protein Dada Bank) 数 
据 库 。 首 先是 从 PDB 库 中 选取 有 三 维 结构 的 蛋白 
质 ;然后 在 GeneBank 中 搜索 编码 该 蛋白 质 的 核酸 
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序列 ;最 后 才 对 二 者 进行 比较 ,分 析 和 计算 。 但 是 
GeneBank 与 PDB 数据 库 都 因 存 在 一 定 的 缺陷 而 使 
研究 效率 降低 :首先 ,Genebank 与 PDB 中 的 数据 信 
息 非 常 元 长 ,例如 Genebank 对 同一 序列 往往 有 大 量 
的 副本 ,尽管 它们 之 间 会 有 少数 核 蔡 酸 的 差异 ;PDB 
数据 库 往往 对 同一 个 蛋白 质 收录 了 多 种 结构 ,有 的 
仅仅 是 几 个 氨基 酸 的 替代 ;其 次 ,PDB 和 Genebank 
都 存在 较 多 的 序列 错误 ,导致 PDB 中 的 蛋白 序列 与 
Genebank 中 的 核酸 序列 不 能 很 好 地 匹配 ;再 者 ,由 
于 了 PDB 和 Genebank 中 的 数据 均 来 自 于 公开 出 版 的 
研究 成 果 , 因 此 数据 格式 也 不 很 统一 。 为 了 使 研究 
工作 更 有 效 地 展开 ,Adzhubei 等 人 建立 了 一 个 名 为 
ISSD( Integrated Sequence-Structure Database ) 的 数 
据 库 (Adzhubei 等 ,1998)。 该 库 在 蛋白 质 的 氨基 酿 
FR BS ae BR PP A a E, aA E 
收录 了 107 个 非 同 源 蛋 白质 的 结构 和 与 其 相对 应 的 
编码 核 疹 酸 序列 ,剔除 了 同 源 蛋 白 和 有 氨基 酸 突变 
的 和 蛋白质, 选取 的 核酸 序列 和 蛋白质 结构 尽量 与 其 
来 源 的 物种 ,组织 和 细胞 类 型 相 匹 配 。 该 库 了 包含 的 
内 容 有 :基因 编码 序列 ,对 应 和 蛋白质 的 氨基 酸 序 列 ， 
和 蛋白质 二 级 结构 ,yg 和 oq 角 以 及 C 骨架 的 原子 从 
te. PULA : http://www. protein. bio. msu.su/issd. 
3.2 研究 展 户 

目前 ， 大 最 的 研究 集中 在 mRNA 序列 与 蛋白 
质 结构 的 关联 性 上 。 但 是 我 们 不 能 忽略 mRNA 二 
级 结构 乃至 三 级 结构 对 翻译 速率 的 影响 以 及 对 蛋白 
质 折 友和 最 终 构象 形成 的 影响 。 因 为 在 细胞 内 ， 
译 过 程 要 涉及 到 mRNA 被 翻译 区 构象 的 解体 ， 这 
是 一 个 克服 自由 能 障碍 的 过 程 。 可 以 设想 ， 由 于 
mRNA 茎 区 存在 碱 基 配对 和 堆积 ， 因 此 该 区 比 单 


链 区 和 环 区 更 稳定 ( 即 具有 更 低 的 自由 能 )， 这 种 
稳定 性 在 一 定 程度 上 会 导致 翻译 速率 的 降低 。 昌 
前 ， 我 们 实验 室 对 “三 维 遗 传 信息 ”的 研究 已 经 有 
所 突破 ， 首 先 ， 我 们 发 现 mRNA 的 二 级 结构 单元 
数 与 其 编码 的 蛋白 质 规则 二 级 结构 (a 一 螺旋 与 B 
一 折 秋 ) 单元 数 之 间 存 在 明显 的 相关 性 ， 二 者 的 总 
符合 率 为 97.3%%， 相 关系 数 达 0.99; HK, RMN 
还 发 现 mRNA 二 级 结构 中 5’ 端 至 3' 端 的 每 一 发 夹 
或 复合 发 夹 与 PDB 数据 库 所 提供 的 蛋白 质 N 端 至 
C 端的 每 一 个 a 一 螺旋 或 B- 折 梧 之 间 存 在 几乎 是 
一 一 对 应 的 现象 。 造 成 这 一 现象 的 原因 是 什么 ? 经 
过 初步 探索 ， 我 们 认为 是 由 mRNA 高 级 结构 不 同 
区 域 或 者 某 些 氨基 酸 的 同 义 密码 子 在 mRNA 高 级 
结构 中 的 不 同 区 域 的 分 布 造 成 了 核糖 体 对 mRNA 
翻译 速率 的 差别 ， 进 而 导致 其 编码 不 同 的 蛋白 质 二 
级 结构 单元 。 而 mRNA 高 级 结构 不 同 区 域 对 翻译 
速率 的 影响 到 底 有 多 大 ? 与 蛋白 质 高 级 结构 的 相关 
性 有 多 大 ? 同 义 密 码 子 在 mRNA 不 同 二 级 结构 中 
的 分 布 是 否 也 是 导致 翻译 速率 差异 的 重要 原因 ? 同 
义 蜜 码 的 替代 对 mRNA 高 级 结构 有 何 影响 ?进而 
对 翻译 速率 积 蛋白质 构象 形成 有 何 影响 ”所 有 这 些 
都 是 今后 要 深入 研究 的 课题 。 

相信 随 着 ISSD 数据 库 的 进一步 丰富 和 mRNA 
高 级 结构 预测 准确 率 的 进一步 提高 ， 有 关 mRNA 
结构 与 蛋白 质 结构 关联 性 的 研究 工作 将 会 生机 勃 勃 
地 展开 。 这 一 研究 将 进一步 加 深入 类 对 遗传 信息 流 
传递 过 程 的 理解 ， 对 蛋白 质 结 构 预 测 ， 丰 富 和 完善 
分 子 生 物 学 的 中 心 法 则 都 具有 重大 的 理论 意义 。 同 
时 对 提高 蛋白 质 工 程 和 遗传 工程 的 生物 活性 分 子 的 
产 率 也 有 重要 作用 ， 因 而 具有 重大 的 实用 价值 。 
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THE RELATIONSHIP BETWEEN mRNA’S SEQUENCE, STRUCTURE, 
TRANSLATIONAL RATE AND PROTEIN STRUCTURE 


LIU Shaun LIU Ci-quan 
( Laboratory of Celi and Molecular Evolution, Kunming Institute of Zoology, Chineses Academy of Sciences, Kunming 650223) 


Abstract; Tricodons on the messenger RNA nucleotide 
sequence decide the amino acid sequence of their en- 
coded protein. However, the rate with which the mR- 
NA is translated in ribosome depends on several pa- 
rameters such as different synonymous codon usage, 
codon-anticodon interactions, codon context and differ- 


ent secondary structures in mRNA. These parameters 
also affect cotranslational folding and assembly of pro- 
tein structure. That suggests the existence of the cor- 
relation between the sequence and structure of mRNA 
and protein structure. 
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structure 


